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6 DISTRIBUCIONES MUESTRALES 


6.1 INTRODUCTION 


En el capitulo 1 hemos definido la inferencia estadistica como un proceso que usa 
informacion proveniente de la muestra para generalizar y tomar decisiones acerca de toda la 
poblacion en estudio. Sin embargo, hasta el momento hemos trabajado la muestra y la 
poblacion por separado. 

En el capitulo 2, trabajamos herramientas utiles en el analisis exploratorio de los datos 
provenientes de una muestra, tanto graficos como resumenes numericos para extraer 
informacion de interes para la inferencia. Hablamos de distribuciones de frecuencias y 
estadisticos. 

En los capi'tulos 3, 4 y 5, a traves del lenguaje de la probabilidad, tratamos los modelos para 
las poblaciones que pueden ser de interes, sobre las cuales nos interesa sacar conclusiones, o 
tomar una decision. Definimos las variables aleatorias, sus distribuciones de probabilidad, 
parametros y algunos modelos frecuentes. 

Podemos hacer un cuadro comparative entre caracteri'sticas del analisis exploratorio de datos y 
de la inferencia estadistica: 


Analisis exploratorio de datos 

Inferencia estadistica 

Su objetivo es la exploration de los datos 
muestrales, en busca de regularidades 
interesantes. 

Su objetivo es responder preguntas 
concretas sobre la poblacion, planteadas 
antes de la obtencion de los datos. 

Las conclusiones solo se aplican a las 
unidades de analisis y a las circunstancias 
para las cuales se obtuvieron los datos. 

Las conclusiones se extienden a toda la 
poblacion en estudio. 

Las conclusiones se basan en lo que 
“vemos” en los datos. 

Las conclusiones se explicitan con un grado 
de confianza. 


Muchas de las tecnicas utilizadas en inferencia exigen, tambien, que la distribucion de los datos 
tenga determinadas caracteri'sticas. El analisis de datos es de gran ayuda en este aspecto, 
para descubrir observaciones atipicas y otras desviaciones que puedan perturbar una correcta 
inferencia. Por lo tanto, en la practica podemos observar como el analisis exploratorio de los 
datos y la inferencia estadistica se complementan. 

Como se menciono en el capitulo I, muy frecuentemente es necesario seleccionar una muestra 
de unidades de la poblacion, para extraer conclusiones respecto de la misma, en base a las 
observaciones muestrales (ver Muestra, pag. 7). 

Sintetizando: 

Cuando el interes reside en generalizar las conclusiones de los resultados observados a la 
poblacion en estudio o queremos tomar una decision sobre la poblacion en base a una 
muestra, estamos frente a un problema de inferencia estadistica. 

Para que este proceso sea adecuado, debemos tener en cuenta: 
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4- Plantear claramente el problema. 

4- Delimitar la poblacion en estudio 1 

4- Definir si el objetivo reside en estimar el valor de un parametro desconocido de la 
poblacion (por ej. p, a, p) a partir de un estadistico calculado con los datos de una 
muestra o decidir sobre valores hipoteticos que asignamos a dichos parametros. 

4- Hacer un correcto diseno para la obtencion de los datos muestrales 2 . Los resultados de 
las tecnicas para la inferencia que se utilizaran solo seran validos si la muestra es 
obtenida por metodos aleatorios, que son los metodos que dan “confianza” de 
seleccionar muestras representativas de la poblacion. Un buen diseno para la 
obtencion de los datos, es la mejor garanti'a de que la inferencia tenga valor. 

4- Tener en cuenta y verificar los requerimientos de las tecnicas a aplicar 


6.2 PARAMETROS Y ESTADISTICOS 


Un parametro es un numero que describe algun aspecto de la poblacion en estudio. En la 
practica, en la mayori'a de los casos (poblacion infinita, pruebas destructivas, etc) el valor del 
parametro es desconocido. 

Un estadistico es un numero que se calcula a partir de los datos muestrales. Si se lo utiliza 
para estimar un parametro desconocido, se lo conoce con el nombre de estimador. 

El objetivo de este capitulo y los proximos es desarrollar el por que y como se utilizan los 
estadisticos para estimar a los correspondientes parametros. 

Tengamos en cuenta que el valor del parametro es fijo, mientras que el valor de un estadistico 
esta en funcion de la muestra seleccionada y por lo tanto podra variar de una muestra a otra. 

Si de alguna manera, pudieramos medir la precision de este proceso, es decir, si pudieramos 
evaluar si el valor del estadistico va a estar cerca del valor del parametro correspondiente, para 
cualquier muestra extraida de la poblacion, entonces estariamos en condiciones de hacer 
“buenas inferencias”. Es aqui donde la tecnica de muestreo y el tamano de la muestra juegan 
un papel fundamental. 

Como se menciono en el capitulo I, pag. 8 trabajaremos con muestras aleatoria simples, en 
donde cada elemento de una muestra de tamano n es una variable aleatoria, siendo Xi, X 2 ,... 
X n , variables independientes entre si 3 . 

Solo cuando se utiliza el azar para escoger los elementos que conforman una muestra, 
podemos describir como varia el estadistico. Al obtener de forma repetida de una poblacion 
distintas muestras del mismo tamano, podemos encontrar la distribution muestra! del 
estadistico , como veremos seguidamente. 


1 Asi, por ej., si se quiere analizar cierta caracteristica de los alumnos que cursaron en la Fac. Reg. Rosario de la 
UTN en los anos 2005 y 2006 y la muestra se elige seleccionando alumnos al azar solamente de los que cursaron 
durante esos anos en ISI, las conclusiones que se extraigan a partir de esta muestra seran validas solo para la 
poblacion de los alumnos de ISI, pero no para todos los alumnos de la Fac. Reg. Rosario. 

2 Ya hemos dicho que en el curso solo se trabajara con muestras aleatorias simples. 

3 En el caso de poblaciones finitas, el muestreo debe ser con reposicion para que la ocurrencia de una observation 
no aumente o disminuya la probabilidad de ocurrencia de otra (ver ej. 1 y 2, pag. 58, Cap. Ill) 
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Denominamos variabilidad muestral al hecho de que el valor de un estadistico varfa en un 
muestreo aleatorio repetido. Para comprenderlo podemos recurrir a la teori'a de la probabilidad 
o la simulation a partir de un ejemplo sencillo, como el que se plantea a continuation. 


6.3 DISTRIBUCION DEL PROMEDIO MUESTRAL 


Consideramos: 


• Variable aleatoria -» X: edad de hermanos de una familia, en anos 


Tamano de la poblacion -» N = 4 

Espacio muestral -> S x = {2, 4, 6, 8} 

Distribucion de probabilidad -> Uniforme discreta 


Tabla 1 

X 

P(X=x) 

2 

0,25 

4 

0,25 

6 

0,25 

8 

0,25 


1 


Parametros: Esperanza Matematica p x = 5 
Varianza g 2 x = 5 


Distribucion de Probabilidad de X 


2 

Q. 



x: edad en anos 


& Tomamos muestras de tamano 2, con reposicion. Cada muestra es de la forma (Xi ; x 2 ), 
donde: 


Xi es el i-esimo elemento de la muestra. 


Simbolizaremos con x al promedio muestral y con S al desvio estandar 
de la muestra. 

En la tabla 2 estan todas las posibles muestras con sus 
correspondientes promedios. 

Observamos que tanto el primer elemento de la muestra como el 
segundo son variables aleatorias, ya que, antes de realizar el muestreo, 
no sabemos que valores tomaran. Si consideramos la distribucion de 
probabilidad de cada una de ellas, resultan identicas a la distribucion de 
probabilidad de la poblacion de la cual fueron extraidas las muestras, 
siendo por lo tanto, iguales los parametros estadi'sticos: 

p xi = 5 y o 2 xi = 5 

En la tabla 2, tambien se visualiza que el promedio muestral es una 
variable aleatoria. 


Tabla 2 

Muestra, n=2 

Xi 

x 2 

Promedio 

2 

2 

2 

2 

4 

3 

2 

6 

4 

2 

8 

5 

4 

2 

3 

4 

4 

4 

4 

6 

5 

4 

8 

6 

6 

2 

4 

6 

4 

5 

6 

6 

6 

6 

8 

7 

8 

2 

5 

8 

4 

6 

8 

6 

7 

8 

8 

8 
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Consideramos ahora esta nueva variable aleatoria 

X : edad promedio de 2 hermanos elegidos al azar de entre los 4, con reposicion. 


Como podemos observar en la Tabla 2, para la variable X : 
Espacio muestral S* = {2, 3, 4, 5, 6, 7, 8} 


La distribucion de probabilidad es: 


Tabla 3: n=2 

X 

Probabilidad 

2 

0,0625 

3 

0,1250 

4 

0,1875 

5 

0,2500 

6 

0,1875 

7 

0,1250 

8 

0,0625 


1,0000 


Distribucion del promedio muestral, n=2 



Promedio de la muestra de tamano 2 


Parametros: Esperanza Matematica //- = 5 

Varianza cr? =2.5 

Observemos que la distribucion del promedio adopta una forma completamente distinta de 
la distribucion uniforme de los datos de origen. 


& Repitiendo la experiencia, con muestras de tamanos 3, 4 y 5 respectivamente, obtenemos 
las distribuciones de los promedios que mostramos a continuation, acompanadas de las 
graficas respectivas: 


n=3 n=4 n=5 


Promedio 

Probabilidad 

Promedio 

Probabilidad 

Promedio 

Probabilidad 

2,00 

0,015625 

2 

0,00390625 

2 

0,00097656 

2,67 

0,046875 

2,5 

0,01562500 

2,4 

0,00488281 

3,33 

0,093750 

3 

0,03906250 

2,8 

0,01464844 

4,00 

0,156250 

3,5 

0,07812500 

3,2 

0,03417969 

4,67 

0,187500 

4 

0,12109375 

3,6 

0,06347656 

5,33 

0,187500 

4,5 

0,15625000 

4 

0,09863281 

6,00 

0,156250 

5 

0,17187500 

4,4 

0,13183594 

6,67 

0,093750 

5,5 

0,15625000 

4,8 

0,15136719 

7,33 

0,046875 

6 

0,12109375 

5,2 

0,15136719 

8,00 

0,015625 

6,5 

0,07812500 

5,6 

0,13183594 


1 

7 

0,03906250 

6 

0,09863281 



7,5 

0,01562500 

6,4 

0,06347656 



8 

0,00390625 

6,8 

0,03417969 




1 

7,2 

0,01464844 


7,6 

0,00488281 

8 

0,00097656 


1 
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0 3Q Distribucion del promedio muestral, n=2 

0,25 n 

w 0,20 

~ n n 

5 0,15 

ro 

2 0,10 1 

a. 

0,05 n r 

0,00 4 1 1 1 1 1 1 

2 3 4 5 6 7 8 

Promedio de la muestra de tamafio 2 


0,20 


0,15 

T3 

CO 

T3 

= 0,10 

-Q 

CO 

n 

I 0,05 


0,00 


Distribucion del promedio muestral, n=3 


n 

2,00 


2,67 3,33 4,00 4,67 5,33 6,00 6,67 7,33 

Promedio de la muestra de tamano 3 


n 

3,00 


0,20 


0,15 


Distribucion del promedio muestral, n=4 


5 0,10 


0,05 


0,00 


- 0 ^ 

2,5 


3 3,5 4 4,5 5 5,5 6 6,5 7 

Promedio de la muestra de tamano 4 


n 

7,5 


Diofrihnrion HpI nrnmprlio miipofral n = f^ 



Promedio de la muestra de tamano 5 
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En las graficas anteriores podemos comprobar una aplicacion del Teorema Central del Llmite: 
a medida que aumenta el tamano de la muestra la distribucion de probabilidad del promedio 
muestral se hace cada vez mas acampanada, concentrandose alrededor del promedio de la 
poblacion original. 


La Tabla 4 permite comparar los parametros esperanza 
matematica y varianza de la poblacion original, con la 
esperanza matematica y varianza de las poblaciones de 
los promedios muestrales antes descriptas. 

Vemos que las medias poblacionales se mantienen 
iguales a 5 (la esperanza matematica de las edades de 
los 4 hermanos), mientras que las varianzas 
poblacionales disminuyen su valor a medida que 
aumenta el tamano de la muestra. 

Al considerar la distribucion de los valores tornados por el estadfstico X en todas las muestras 
de un mismo tamano n de la misma poblacion, obtenemos la distribucion muestral de X. 


Tabla 4 

Poblacion 

M x =5 

<^ = 5 

Tamano de 


2 

muestra 

Mx 


2 

5 

2,5 

3 

5 

1,667 

4 

5 

1,25 

5 

5 

1 
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Generalizando: 


Distribution muestral de la media muestral X 

Si las muestras aleatorias simples de tamano n son tomadas de una poblacion con 
media poblacional ji y desvio estandar poblacional <5 , la distribucion muestral de 

X tiene las siguientes propiedades: 

* 1) H,=E(X)=n 

Es decir, el promedio de todos los posibles valores de X es igual al parametro n 
*2) a* = 

Cuando el tamano de la muestra aumenta, la medida de dispersion disminuye. Es 
decir, a medida que el numero de observaciones obtenidas aumenta, el promedio 
de los valores observados se acerca mas y mas a n (Ley de los grandes 
numeros) 



3) Si la poblacion de la cual se extraen las muestras es normal, 

la distribucion de X es tambien normal con media y desvi'o como los dados en los 
puntos anteriores, para cualquier tamano muestral n. 

4) Si la poblacion de la cual se extraen las muestras no es normal, 
pero el tamano muestral es “suficientemente” grande, la distribucion de X es 
aproximadamente normal con media y desvi'o como los dados en los puntos 
anteriores. Suficientemente grande en la practica significa un tamano de muestra n 
k 30 (Teorema Central del Li'mite). 

El tamano n de la muestra, necesario para que X se aproxime a una distribucion 
normal depende de la distribucion de la poblacion. En el caso de que las muestras 
se extraigan de una poblacion uniforme son suficiente 6 observaciones para que la 
distribucion del promedio muestral sea aproximadamente normal. 

5) Si la poblacion de la cual se extraen las muestras es normal, 
con media poblacional n y desvi'o estandar poblacional G , pero esta es 
desconocida, se reemplaza G por S (desvi'o estandar muestral) y la estadi'stica 

(-EzV) deja de tener distribucion normal estandarizada y tiene una distribucion t 

S/yJn 

Student con n-1 grados de libertad (a) : 


(X-v) 

S/Vn 


f n-l;a 


(Ver demostraciones en el Apendice) 


^ La apariencia general de la distribucion t es similar a la de la distribucion normal estandar: ambas son simetricas 
y unimodales y el valor maximo de la ordenada se alcanza en la media \x = 0. Sin embargo esta distribucion tiene 
colas mas amplias que la normal. Existe una distribucion t distinta para cada tamano de muestra. Una distribucion t 
viene determinada por un parametro llamado grados de libertad. A medida que aumentan los grados de libertad, la 
curva de densidad t se parece mas a la curva de la N(0,1), ya que la estimacion de a por s se va haciendo mas 
precisa. 
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4- La propiedad 1 indica que el estimador X es insesgado, ya que el centra de su 
distribucion muestral es igual al valor del parametro poblacional correspondiente. 

4- La propiedad 2 hace a la variabilidad o precision del estimador y vemos que a medida 
que el tamano muestral crece la precision del estimador es mayor, ya que la variacion 
alrededor del parametro desconocido disminuye (propiedad de convergencia). Si la 
distribucion de un estadistico muestra valores muy alejados, se dice que carece de 
precision. 


Idealmente buscamos un estimador que cumpla estas dos propiedades: que sea insesgado y 
convergente 4 : 


Un estadistico es insesgado si el centra de su distribucion muestral es igual al 
valor del parametro poblacional correspondiente. 

Un estadistico es convergente si su desviacion estandar disminuye a medida 
que el tamano de muestra crece. 


El estadistico X , por poseer estas propiedades, es un buen estimador de ji . 

Estas propiedades tambien se cumplen para la proporcion muestral o frecuencia relativa ( f r ) y 
la varianza muestral (S 2 siendo por lo tanto respectivamente, buenos estimadores de la 
proporcion poblacional (p) y varianza poblacional (a 2 ), como veremos en los puntos 6.4 y 6.5.- 

En general, la notacion que utilizaremos para los estimadores es la siguiente: 


Parametro 

Estimador 

M 

IX 

II 

<ZL 

P 

P = f r 

a 2 

~ 2 _ c 2 

(J - 


4 Estas condiciones permiten controlar los errores de estimacion al aumentar el tamano de la muestra, como 
veremos mas adelante. 
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6.4 DISTRIBUCION DE LA FRECUENCIA RELATIVA o PROPORCION 
MUESTRAL 

El estadi'stico p = f r es un buen estimador del parametro p (proporcion poblacional o 
probabilidad). 

Si simularamos tomar muchas muestras de igual tamano y en cada una de ellas calcularamos 
la proporcion de veces que ocurre un suceso A, hallari'amos: 

La distribucion de la proporcion muestral es aproximadamente normal 5 
Su media se encuentra cerca de la proporcion poblacional p 

Su desviacion estandar se hace menor a medida que el tamano de la muestra se hace 
mayor. 


Generalizando: 


Distribucion muestral de la p = f r (proporcion muestral) 


Si de una poblacion donde p representa la proporcion de elementos que tienen 
cierta caracteristica A, se toman muestras aleatorias simples de tamano n, la 
distribucion muestral de la proporcion muestral o frecuencia relativa (p = f r ) de las 
veces que ocurre A en n, tiene las siguientes propiedades: 

^1) E(f r ) = p 

Es decir, el promedio de todos los posibles valores de f r es igual al parametro p. 

, Ip(l-p) 

*2) a p = VVar(p) = J— — 

Cuando el tamano de la muestra aumenta, la medida de dispersion disminuye. Es 
decir, a medida que el numero de observaciones obtenidas aumenta, el promedio 
de los valores observados se acerca mas y mas a p (Ley de los grandes numeros) 

Observe que para un tamano de muestra fijo, la maxima desviacion estandar se 
encuentra en p = 0,5 


^ 3) Si n es “suficientemente” grande (b) , la distribucion de p = f r 
se comporta aproximadamente como una distribucion normal con media y 
desviacion estandar como las dadas en los puntos 1 y 2. 


p es aproximadamente 


N 


p; 


P(1-P) 


(Ver demostraciones en el Apendice) 


Para poder aproximar la distribucion Binomial a la Normal, el tamano de muestra n debe ser “suficientemente” 
grande. Como regia empirica esta aproximacion es apropiada si np > 5 (Cap. 4). 
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6.5 DISTRIBUCION DE LA VARIANZA MUESTRAL 

El estadi'stico S 2 _, es un buen estimadordel parametro a 2 (varianza poblacional). 6 

Si simularamos tomar muchas muestras de igual tamano y en cada una de ellas calcularamos 
la varianza muestral, hallariamos: 

La media de la varianza muestral se encuentra cerca de la varianza poblacional o 2 

Su desviacion estandar se hace menor a medida que el tamano de la muestra se hace 
mayor. 

Generalizando: 


Distribution muestral de la S 2 (varianza muestral) 


Si de una poblacion se toman muestras aleatorias simples de tamano n, la 
distribucion muestral de la varianza muestral S 2 _, , tiene las siguientes propiedades: 

^ 1) E (S 2 ) = cr 2 

Es decir, el promedio de todos los posibles valores de S 2 _, es igual al parametro a 2 


2 ) 


V(S 2 ) = a| 2 


2a 4 


n-1 


Cuando el tamano de la muestra aumenta, la medida de dispersion disminuye. Es 
decir, a medida que el numero de observaciones obtenidas aumenta, el promedio de 
los valores observados de S 2 se acerca mas y mas a ct 2 (Ley de los grandes 
numeros). 


3) Si la poblacion de la cual se extraen las muestras es normal, 


la variable 
libertad (b) : 


(n-1) 


tiene una distribucion ji cuadrado (x 2 ) con n-1 grados de 


(n-1) S 2 


Zn-1 


^•4) Si n es “suficientemente” grande, la distribucion de la variable 
X 2 se ve como una distribucion normal con media y desviacion estandar como las 
dadas en los puntos 1 y 2. 

(Ver demostraciones en el Apendice) 


* b> Las distribuciones ji cuadrado son una familia de distribuciones que solo toman valores positivos y que son 
asimetricas hacia la derecha. Una distribucion ji cuadrado viene determinada por un parametro llamado grados de 
libertad. A medida que aumentan los grados de libertad, las curvas de densidad son menos asimetricas y por lo 
tanto, los valores mayores son mas probables. 


1 Utilizaremos la notacion S para identificar a la variable S n _ 1 (varianza muestral). 
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En este material hemos tratado el comportamiento de las distribuciones muestrales de algunos 
estimadores cuando se toman muestras aleatorias simples. 

Se analizo que si el tamano de muestra es mas grande, la distribucion de estos estimadores 
tiende a centrarse mas y mas alrededor del valor del parametro que se quiere estimar. 

En la practica no se conocera el verdadero parametro poblacional (por eso la estimacion) y se 
tomara una sola muestra (no muchas como cuando se simulo la distribucion del promedio 
muestral), pero son las propiedades (insesgado y convergencia) las que garantizan que cuando 
la muestra que se toma sea grande habra una alta probabilidad de que el valor que toma el 
estimador (estimacion) este cerca del verdadero valor del parametro que se quiere estimar. 


6.6 EJERCICIOS PROPUESTOS 7 

1. - El 9 % de los individuos de una region tiene sangre tipo B. En una muestra simple al azar de 

400 personas de esa poblacion se encontro que 12,5 % tem'an sangre tipo B. 

a) Indique: 

- valor numerico del parametro: 

- valor numerico del estadistico: 

- identifique en terminos del problema al parametro y al estadistico 

b) i,Cual es la probabilidad de que una nueva muestra aleatoria de tamano 400 contenga 
por lo menos un porcentaje de 12,5 % de personas con sangre tipo B? 

2. - Considere la variable aleatoria X: peso de alumnos varones de UTN, FRRO. 

Se conoce que esta variable tiene una distribucion normal con promedio 75 kg y una 
desviacion estandar de 7 kg. 

a) Grafique y compare las distribuciones muestrales de X cuando se extraen muestras 
aleatorias simples de: 

*10 alumnos * 30 alumnos *100 alumnos 

b) i,Cual es la proporcion de muestras de tamano 30 que arrojaran un valor del promedio 
alejado del promedio poblacional en a lo sumo 2 desviaciones estandares? 

3. - Suponga que el 60% de todos los estudiantes de la UTN, Reg. Rosario acceden a 

informacion sobre cursos por medio de Internet. 

a) Grafique en forma aproximada la distribucion para la posible proporcion muestral basada 

en una muestra aleatoria simple de 100 estudiantes. 

b) i,Cual es la probabilidad de observar una proporcion muestral de 0,50 basada en una 
muestra aleatoria simple de tamano 100 si la proporcion poblacional fuese de 0,60? 
Explique. 

4. - Sea X el numero de accidentes por semana en una esquina dada. Suponga que la media de 

X es 2,2 y el desvfo estandar de X es 1 ,4. 

a) Sea X el numero promedio de accidentes por semana en un ano, o sea, n= 52 semanas. 
i,cual es la distribucion aproximada de la media muestral? Bosquejela. 


7 Los ejercicios 1, 3 y 4 fueron extraidos y adaptados del modulo Numero 7: Distribuciones muestrales de la 
Coleccion Metodos Estadisticos I., redactado por docentes de la UNR y extractado del libro “Interactive Statistics” 
de Martha Aliaga, Universidad de Michigan, 2002. 
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b) icua\ es la probabilidad de que el promedio de accidentes por semana en un ano sea 

menor que 2? 

c) i Cuan probable es que el numero total de accidentes por ano sea menor que 100?. 

100 

Sugerencia: P (Total < 100) = P (Promedio < ). 

5.- Un contratista de obras viales ha tornado un contrato para construir una carretera de 
hormigon de 800 km. de longitud. La carretera a construir sera inspeccionada por vialidad 
tomando muestras de tamano 9 por cada 5 km. construidos. El tramo de 5 km. se aceptara 
sin objeciones si la media de los espesores de las 9 determinaciones supera 149 mm. En 
este caso la ganancia para el contratista es de 5000$ en los 5 km. 

Si el promedio de las 9 determinaciones de los espesores se encuentra entre 140 mm y 149 
mm tambien se aprueba el tramo pero con una quita en el precio, obteniendose entonces 
una utilidad de 2300$. 

En cualquier otro caso se debe rehacer el tramo, lo que significa una perdida de 3000$. 

La variable aleatoria espesor tienen distribucion normal con esperanza matematica igual a 
145 mm y desvfo estandar igual a 15 mm. 

Considere la variable aleatoria “utilidad por tramo de 5 km.” Encuentre su distribucion de 
probabilidad, esperanza matematica y varianza. 

i,Cual es la probabilidad de que la construction de los 800 km. de una utilidad inferior a 
300.000$ si los espesores son independientes de tramo a tramo? 


6.- Demuestre que Xes un estimador consistente de p mediante el empleo de la desigualdad 
de Chebyshev (vea ley de los grandes numeros en apendice) 
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APENDICE 


1.- Promedio Muestral o Media Aritmetica 




Siendo E(X) = p y V(X) = a 2 

y teniendo una Muestra Aleatoria Simple de tamano n => (X-i, X 2 X n ), 

entonces E( X ) = p y V(Xj) = a 2 (estas condiciones fueron visualizadas en pag. 129 para 
muestras de tamano 2). 


Luego 


E(X)=E[-f j Xi] 

n i 


-E(f j Xi) = - f j E(Xi) = -n M = ju 
n ! n i n 


y{X)=y[-f J xi] = -\v(£xi) = = \ n v{Xi) = -a 2 

n i n i « i « « 


Con respecto a la distribucion la variable promedio muestral podemos decir: 

a) Si la variable aleatoria X se distribuye normalmente, por propiedad reproductiva : 

X ~ 

yjn 

b) Si la variable X tiene cualquier distribucion pero n > 30 aplicando el Teorema Central del 
Llmite, la distribucion aproximada es : 

X ~ N(<u,^=) 

■sin 


2.- Proporcion Muestral o Frecuencia Relativa 

Sea una experiencia aleatoria y un suceso A asociado a la misma. Se realizan n 
repeticiones independientes de la experiencia. Se definen las variables: 

n A : numero de veces que ocurre A en las n repeticiones independientes de la experiencia 

f A :proporcion de veces que ocurre A en las n repeticiones independientes de la experiencia 

siendo f A = — 

n 

La variable aleatoria n A tiene distribucion binomial con E (n A ) = n.p y a z (n A ) = n.p.(l-p) 


y en consecuencia 

Q_ 

II 

*< 

L U 

y 





n 
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3.- Varianza muestral (S 2 ) 

En la pagina 135 se plantea, para el caso en que la variable X se distribuya normalmente, que: 
E ( S 2 ) = < 7 2 

V ( S 2 ) = 4=^4 
* n - 1 

A continuation se demuestran ambas igualdades. 


Si X~N ((i,o) 


(X-p) 

CT 


~ N (0, 1) 


(X-p) 2 


X 2 1 


y en consecuencia : 


r W-m ) 2 


z 

1=1 


X n 


por propiedad reproductiva de la distribution ji cuadrado 


Se demuestra 
£ (Xj-X ) 2 


que: 

~ X 2 n-1 


o en forma equivalente: 


(n-l)S 2 


X n-1 


Ademas, para una variable % 2 n sus parametros son => E (x 2 n ) = n y V (x 2 n ) = 2 n 
y en consecuencia para x 2 n-i E (x 2 n -i ) = n - 1 y V (x 2 n -i) = 2(n-1) (1) 


Reemplazando en (1) 






(n-1) S 2 
a 2 

=( n — 1 ) 


E(S 2 ) = a 2 


V 


(n-1) S 2 


(n-1) 2 V(S 2 ) 


= 2 (n-1) 


V(S 2 ) = 


2 a 4 

(n-1) 
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4 .- LEY DE LOS GRANDES NUMEROS 

En el capi'tulo 3 se dijo que despues de un gran numero de repeticiones de una experiencia, la 
proporcion de veces que ocurre un suceso en las n repeticiones (frecuencia relativa), se acerca 
a la probabilidad de ese suceso. Esto se conoce como “ley de los grandes numeros” y se 
puede demostrar matematicamente a partir de las leyes de probabilidad 8 . 

4- Consideremos una experiencia aleatoria y un suceso A asociado a la misma. Se realizan 
n repeticiones independientes de la experiencia y se definen las variables: 

n A : numero de veces que ocurre A en las n repeticiones de la experiencia 

f A : proporcion de veces que ocurre A en las n repeticiones de la experiencia 


siendo f A = — 

A n 

Se conoce que P(A) = p se mantiene constante en las n repeticiones de la experiencia. 
Se demuestra que para un numero positivo s: 


P ( I f A - P | < e) > 1 - 


P(1-P) 


y h'm P(|f A -p|< S) = 1 

n^-oo 


es decir, que cuando n tiende a infinito la frecuencia relativa tiende a la probabilidad ( definition 
frecuencial de probabilidad ). 


Demostracion : 


n A ~ Bi ( n , p ) E ( n A ) = n p a 2 ( n A ) 
y en consecuencia E ( f A ) = p a 2 ( f A ) 
Aplicando la desigualdad de Tchebychev : 


n p ( 1 — p ) 

P(l-P) 

n 


P 


f a - P I ( k 


P(i-P) 



(1) 


Sea s = k 


P(l-P) 


entonces k 2 = n£ 


P(l-P) 

Reemplazando en (1), se obtiene lo que se queria demostrar: 


P ( I f a - P | < e ) > 1 - 


P(1-P) 


n e 


8 La ley de los grandes numeros se puede demostrar tambien a partir del comportamiento del promedio muestral. A 
medida que el numero de observaciones obtenidas aumenta, la media de los valores observados se acerca mas y 
mas a | u. 
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